"""
PDF文件解析工具
"""
from markitdown import MarkItDown

def parse_pdf(pdf_path: str) -> str:
    """将PDF文件转换为Markdown文本
    
    Args:
        pdf_path: PDF文件路径
        
    Returns:
        str: 转换后的Markdown文本
    """
    md = MarkItDown(enable_plugins=False)
    result = md.convert(pdf_path)
    return result.text_content

# 为了向后兼容,保留PDFParser类
class PDFParser:
    """PDF解析器,使用markitdown将PDF转换为Markdown格式"""
    
    def __init__(self):
        self.md = MarkItDown(enable_plugins=False)
        
    def parse_to_markdown(self, pdf_path: str) -> str:
        """将PDF文件转换为Markdown文本
        
        Args:
            pdf_path: PDF文件路径
            
        Returns:
            str: 转换后的Markdown文本
        """
        return parse_pdf(pdf_path)